機器人“拜師學藝”獲“數(shù)據(jù)秘籍”
來源:科技日報
科技日報記者 馬愛平
彎肘、抬臂、向前抓取……在江蘇箸境智能科技有限公司(以下簡稱“箸境智能”)的采集室內,工作人員屏幕前的每一個基礎動作,都同步映射為機器人的精準動作,進而轉化為一條條包含視頻、關節(jié)角度與力矩等信息的結構化數(shù)據(jù)。
近日,由箸境智能上架的“具身智能數(shù)據(jù)集”在江蘇省數(shù)據(jù)交易所完成交易,實現(xiàn)全國該領域零的突破。
具身智能數(shù)據(jù)集是為訓練與評估具身智能系統(tǒng)而構建的多模態(tài)數(shù)據(jù)集合,專門記錄智能體如機器人在物理或虛擬環(huán)境中通過“身體”與環(huán)境交互的全過程數(shù)據(jù),用于提升其感知、決策、執(zhí)行與反饋能力。
“高質量數(shù)據(jù)產品正成為市場競逐的焦點,這類數(shù)據(jù)集具備鮮明的‘三高’特征,即高價值應用、高知識密度與高技術含量。”江蘇省數(shù)據(jù)交易所相關負責人表示,此類數(shù)據(jù)集不僅是模型迭代的核心燃料,更是AI技術與實體經(jīng)濟深度融合不可或缺的基礎性支撐,在市場中日益受到高度關注與迫切需求。
據(jù)了解,此次完成交易的具身智能數(shù)據(jù)集,包含約2.5萬條結構化數(shù)據(jù),覆蓋辦公、商超、餐飲、家政四大場景。每條數(shù)據(jù)時長約10秒,容量從幾十兆到上百兆字節(jié)不等,不僅包含機器人“視角”的實時畫面,還完整記錄了執(zhí)行過程中各關節(jié)的電流、角度、力矩等參數(shù),并附帶任務指令,結構清晰,可直接用于模型訓練。
“機器人每完成一次任務,就產生一筆數(shù)據(jù)。而機器人訓練對數(shù)據(jù)的需求極大,通常需達到數(shù)萬條規(guī)模。數(shù)據(jù)量越大、覆蓋場景越全,模型的執(zhí)行精度就越高。”箸境智能技術員王煊介紹。
如果企業(yè)通過直接采購,獲得的將是一套經(jīng)過深度清洗、嚴密標注且可直接投入模型訓練的基礎動作體感數(shù)據(jù)信息?!斑@不僅省去了從零搭建采集環(huán)境、反復調試數(shù)據(jù)質量的漫長周期,更顯著降低了自行探索中的試錯成本與不確定性,從而能夠以更高起點、更快速度推進AI模型在復雜真實環(huán)境中的認知與執(zhí)行能力迭代?!蓖蹯舆M一步解釋。
“目前,從全球范圍內來看,具身智能數(shù)據(jù)集仍是機器人產業(yè)發(fā)展的關鍵短板?!眹业胤焦步ㄈ诵螜C器人創(chuàng)新中心首席科學家江磊表示。
面對這一挑戰(zhàn),國家數(shù)據(jù)發(fā)展研究院院長胡堅波透露,我國正按照“1+3+5+N”的思路,依托1個高質量數(shù)據(jù)集管理服務平臺,從3個層次推進高質量數(shù)據(jù)集基礎設施化,通過5類建設主體,以N個典型應用場景為牽引,聚焦重點行業(yè)領域和創(chuàng)新領域,建設高質量數(shù)據(jù)集,服務人工智能模型開發(fā)和應用。本次上架的“具身智能數(shù)據(jù)集”正是由企業(yè)作為建設主體,以具身智能典型應用場景為牽引打造的高質量數(shù)據(jù)集。